摘要: 目前对于查询相似度的计算通常是从比对检索结果与查询式的相似度来考虑。本文提出一种基于贝叶斯分类的算法来计算XML查询结果相似度。在计算出每个检索结果文档与查询式相似度的基础上,使用贝叶斯分类器将XML检索文档分类成相关与不相关两个集合,再由计算相关文档与不相关文档的相似度来决定最终的相似度值。最后,通过实验分析表明,在不影响查全率的前提下,这样得到的相似度计算精度比传统方法高15%左右,有效地提高了检索性能。
中图分类号:
韩晓梅;郑洪源;丁秋林. 一种基于贝叶斯分类的XML检索文档相似度算法[J]. 计算机与现代化, 2012, 1(1): 34-36,8.
HAN Xiao-mei;ZHENG Hong-yuan;DING Qiu-lin. An XML Retrieval Document Similarity Algorithm Based on Bayesian Classifier[J]. Computer and Modernization, 2012, 1(1): 34-36,8.